數據科學與商業分析 用機器學習與統計學優化商業決策

數據科學與商業分析 用機器學習與統計學優化商業決策

作者: [美] 馬特·塔迪(Matt Taddy)
出版社: 人民郵電
出版在: 2021-03-01
ISBN-13: 9787115559135
ISBN-10: 7115559139
裝訂格式: 平裝
總頁數: 251 頁





內容描述


大數據和機器學習等的興起使得商業分析領域越來越倚重數據科學。本書詳細介紹了商業數據科學中的關鍵元素,匯集了機器學習、經濟學以及統計學領域的核心原則和最佳實踐,內容涵蓋識別商業政策中的重要變量、通過實驗測量這些變量,以及挖掘社交媒體以瞭解公眾對於政策修改的反應,為從事商業數據科學的數據科學家和商業人士提供了必備工具。書中通過大量數據分析示例講解如何利用R語言編寫腳本來解決復雜的數據科學問題。


目錄大綱


對本書的讚譽
獻詞
前言
常見符號的標準用法
第0章引言1
從兩張圖說起1
大數據與機器學習4
計算6
第1章不確定性14
1.1頻率不確定性和bootstrap方法14
1 .2假設檢驗和錯誤發現率控制25
1.3貝葉斯推斷33
第2章回歸37
2.1線性模型37
2.2邏輯回歸46
2.3偏差與似然49
2.4 ◆回歸不確定性53
2.5空間和時間56
第3章正則化64
3.1樣本外預測效果64
3.2正則化方法68
3.3模型選擇77
3.4 ◆lasso的不確定性量化87
第4章分類94
4.1最近鄰94
4.2概率、成本和分類97
4.3多元邏輯回歸102
4.4分佈式多元回歸106
4.5分佈式與大數據110
第5章實驗114
5.1隨機控制試驗115
5.2近似實驗設計125
5.3 ◆工具變量135
第6章控制143
6.1條件可忽略性與線性處理效果143
6.2高維混淆變量調整146
6.3 ◆樣本分割與正交機器學習148
6.4異質性處理效果152
6.5合成控制法164
第7章分解167
7.1聚類167
7.2因子模型和主成分分析173
7.3主成分回歸180
7.4偏最小二乘法184
第8章文本作為數據189
8.1分詞190
8.2文本回歸194
8.3主題模型194
8.4多元逆回歸200
8.5協同過濾204
8.6詞嵌入技術206
第9章非參數方法209
9.1決策樹210
9.2隨機森林216
9.3因果關係樹224
9.4半參數方法與高斯過程228
第10章人工智能233
10.1什麼是人工智能233
10.2通用機器學習237
10.3深度學習240
10.4 ◆SGD 244
10.5強化學習248
10.6商業環境中的人工智能251


作者介紹


Matt Taddy,美國經濟學家、數據科學家。
現任亞馬遜北美首席經濟學家、大名鼎鼎的亞馬遜經濟學家團隊Central Economics Team VP。
曾任芝加哥大學布斯商學院計量經濟學和統計學教授,明星教師,開創了數據科學課程。
曾任微軟商務人工智能首席研究員、eBay研究員。




相關書籍

CPython Internals: Your Guide to the Python 3 Interpreter

作者 Shaw Anthony

2021-03-01

Python Web 開發從入門到實戰(Django+Bootstrap)- 微課視頻版

作者 錢彬

2021-03-01

結構方程模型分析實務:SPSS 與 SmartPLS 的運用

作者 陳寬裕

2021-03-01